查看原文
其他

如何在AER上用OLS发经济史研究, 这篇道出了验证IV合理性的标准范式! 必读

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于下方文字内容,作者:李松泽,北京大学现代农学院,通信邮箱:964916858@qq.com

作者之前的文章:实证应用经济学中的稳健性检验是什么? 怎么做?哪些策略呢?中介效应分析新进展和检验方法!谁嫁(娶)给了谁?基于CHIP的DID方法发现, 与岳父母的教育有关!重新思考BK中介模型, 关于中介效应分析的神话与事实!JEEM上关于中国环境领域下载量最高的文章很有意思!男神毛咕噜最新Top5大作, 另外, 有序因变量依然使用OLS回归! ⑦万字长文述"家庭经济学"进展, 诺奖得主贝克尔长耕于此!最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,⑨如何设计双重差分法DID: 各种政策研究的最佳指南! ⑩真相, 你的实证研究结果中到底隐藏了多少不为人知但自知的秘密?
Lowes, Sara, and Eduardo Montero. 2021. "The Legacy of Colonial Medicine in Central Africa." American Economic Review, 111 (4): 1284-1314.
Between 1921 and 1956, French colonial governments organized medical campaigns to treat and prevent sleeping sickness. Villagers were forcibly examined and injected with medications with severe, sometimes fatal, side effects. We digitized 30 years of archival records to document the locations of campaign visits at a granular geographic level for five central African countries. We find that greater campaign exposure reduces vaccination rates and trust in medicine, as measured by willingness to consent to a blood test. We examine relevance for present-day health initiatives; World Bank projects in the health sector are less successful in areas with greater exposure.

中非地区殖民医疗运动的长期影响

摘要

1921年至1956年间,法国殖民政府为防治昏睡病,强制中非地区的村民进行体检并向他们注射具有严重副作用的药物。本文将历史档案数字化,确定了殖民医疗运动覆盖的精细地理层级。研究发现,殖民医疗运动暴露程度越高的地区,疫苗接种率和医疗信任度越低,并且世界银行健康部门的项目也更难在当地成功开展。

引言

20世纪20年代至50年代,法国殖民政府在撒哈拉以南的非洲地区(如图1所示)开展了一系列针对热带疾病的医疗运动,其中规模最大的一项是对昏睡病(sleeping sickness)的防治。当地居民被强制注射医疗药物,这些药物疗效有限,但却可能导致失明、坏疽甚至死亡等副作用。对于多数中非地区居民来说,这些医疗运动是他们对现代医学的第一次接触。

受人类学和历史学的文献启发,本文假设防治昏睡病的殖民医疗运动会影响中非地区居民对现代医学的信任以及现代健康干预措施的成功率。为了验证这一假设,本文检验了历史的殖民医疗运动对现代的疫苗接种率、医学信任以及世界银行健康项目实施效果的影响。

数据描述

1. 历史数据

本文使用的历史数据主要来源于法国的军事档案。该档案收录了中非地区各国殖民政府提交给法国的年度报告,其中记载了该年度于殖民地开展的医疗活动,重点关注昏睡病的防治运动。报告记录了昏睡病医疗队到访的地区,以及在基本地理单位实施的治疗类型。
根据法国军事档案的历史记录,本文构建了喀麦隆和前法属赤道非洲国家的昏睡病医疗运动面板数据。其中,前法属赤道非洲国家的面板数据为1927年至1956年街道层面的数据,喀麦隆的面板数据为1921年至1950年种族聚居区的数据。数据记录了医疗运动到访的地区以及实施的治疗方案。本文用30年中被访问的年数占比来刻画特定地区的殖民医疗运动暴露程度。图2展示了1921年至1956年间中非地区国家的基本地理单位被殖民医疗运动访问的年数,可以看到不同地区的暴露情况存在差异。

2. 现代数据

本文将殖民医疗运动的历史数据和人口与健康调查(DHS)的现代数据相结合。同时,为了控制可能同时影响历史医疗运动暴露率和现代疫苗接种情况以及医学信任度的协变量,本文还将GIS数据(包括气候、地形和疾病适宜度)与殖民时期和前殖民时期的数据相结合。此外,在拓展分析中,本文还使用了包含地理定位的非洲晴雨表数据以及世界银行发展项目数据。
本文有两个关键因变量。第一个因变量是疫苗接种指数。DHS数据记录五岁以下儿童是否接种了预防小儿麻痹症、结核、白喉、破伤风、百日咳和麻疹等疾病的9种疫苗。本文构建的疫苗接种指数表示在这9种疫苗当中,五岁以下儿童完成接种的疫苗数量占比。
第二个因变量是医学信任度。DHS并未直接测量受访者对医学的信任水平,但会询问他们是否愿意参与诊断贫血或HIV感染的血液检测。本文使用“拒绝接受血液检测”作为“不信任医学”的代理变量,通过显示偏好来度量受访者对医学的信任水平。

分析

为了检验殖民医疗运动暴露水平与关键因变量之间的相关关系,本文将估计如下方程:

1. OLS估计

从图3的分箱散点图(binscatter)中可以看出,医疗运动暴露水平与疫苗接种指数呈明显的正相关关系,与血液检测拒绝率呈明显的负相关关系。

表1报告了医疗运动访问年数占比对疫苗接种指数(第1-3列)和血液检测拒绝率(第4-6列)影响的OLS估计结果。样本的疫苗接种指数平均值为0.532,血液检测平均拒绝率为4.8%。根据第2列和第5列的估计结果,若某地区在历史上(1921年至1956年)曾被殖民医疗运动访问了15年,那么平均而言该地区在现代的疫苗接种指数会下降5.8个百分点,血液检测拒绝率会上升5.4个百分点。

2. IV估计

OLS估计的结果初步表明,历史上暴露于殖民医疗运动的程度与今天的疫苗接种率负相关、与今天的血检拒绝率正相关。但考虑到反向因果和遗漏变量的存在,OLS估计得到的相关关系无法揭示殖民医疗运动对关键结果变量的因果效应。具体来说,当地居民初始的疫苗接种倾向以及信任水平可能会影响医疗运动的选址,并且可能存在同时影响医疗运动访问频率以及疫苗接种率和医学信任的未观测变量。本文采用工具变量法来处理潜在的内生性问题。
本文选取的工具变量为木薯相对于小麦的土壤适宜度(取对数),相关数据来源于联合国粮农组织Global Ecological Zones数据库。根据历史文献记载,种植木薯与患昏睡病存在关联。这可能是由木薯的特征决定的。首先,村民常需要在河边浸泡木薯以去除其中的氰化物,这增加了他们暴露于采采蝇栖息地的风险。其次,木薯相比于传统作物每公顷能产出更多的卡路里,农民只需耕整较少面积的土地便能获取所需的能量,而未清理土地上的灌木丛则会成为采采蝇的温床。因此,本文工具变量的核心逻辑在于:在木薯土壤相对适宜度更高的地区,人们暴露于采采蝇栖息地的风险更高,因而更有可能导致昏睡病的流行。
为了展示工具变量的合理性,本文首先检验了木薯土壤相对适宜度是否能够预测昏睡病的初始患病率。“第零阶段”分析的结果如表2所示,木薯土壤相对适宜度越高,昏睡病初始患病率越高。

表3报告了工具变量估计的结果,其中面板A和面板B分别为第一阶段和第二阶段估计。如面板B第2列和第5列所示,若某地区在历史上(1921年至1956年)曾被殖民医疗运动访问了15年,那么该地区在现代的疫苗接种指数会下降12.6个百分点,血液检测拒绝率会上升8.2个百分点。对比IV和OLS的估计结果发现,OLS所得系数存在向下偏误,这可能是由于殖民医疗队会避免访问那些信任水平较低、更加抵抗治疗的地区。

3. 证伪检验

为了说明“木薯相对于小麦的土壤适宜度”满足排他性约束,本文借助喀麦隆的独特历史来证明该工具变量不会直接影响结果变量。
喀麦隆自1884年起成为德国的殖民地,在第一次世界大战后被英国和法国殖民者瓜分(如图4所示)。殖民医疗运动仅在前法属喀麦隆地区开展,而前英属喀麦隆地区则无类似的运动。喀麦隆独特的历史为工具变量的证伪检验提供了思路:若木薯相对于小麦的土壤适宜度满足排他性约束,那么该变量应该无法预测前英属喀麦隆地区的疫苗接种率和血检拒绝率。

如表4所示,本文分别估计了工具变量对前英属喀麦隆地区和前法属喀麦隆地区的疫苗接种指数和血检拒绝率的影响。为了保证地区的可比性,此处仅考虑与前殖民地边界距离不超过50千米的样本。可以看到,对于前英属喀麦隆的样本,工具变量与关键结果变量无明显关联,系数接近于0且不显著;对于前法属喀麦隆的样本,木薯相对于小麦的土壤适宜度与疫苗接种指数显著正相关,与血检拒绝率显著负相关。同时,统计检验拒绝了两地区估计系数相同的原假设。因此,证伪检验表明本文的工具变量不会对结果变量产生直接影响。

世界银行项目实施效果

本文使用含地理位置的世界银行项目数据来检验殖民医疗运动对当前健康政策实施效果的影响。在世界银行数据集中,所有项目会被归为健康、中央政府管理、公共管理、其他社会服务以及铁路、道路和高速公路5种类别,并且部分项目的实施效果会按如下标准进行评分:1 = 非常不理想,2 = 不理想,3 = 比较不理想,4 = 比较理想,5 = 理想。
表5报告了殖民医疗运动暴露水平对世界银行项目实施效果影响的混合OLS估计结果。因变量的总体均值为3.66,表明世界银行项目的平均实施效果处于“比较不理想”和“比较理想”之间。从估计系数可以看出,若某地区在历史上(1921年至1956年)曾被殖民医疗运动访问了15年,那么世界银行的健康项目在该地区的实施效果平均而言会下降1分,即由“比较满意”下降至“比较不满意”。

机制

通过上述分析可以发现,历史上的殖民医疗运动损害了中非地区国家居民对现代医学的信任,从而导致该地区疫苗接种率低、健康项目实施效果不理想。在此基础上,本文进一步探究了殖民医疗运动的额外作用机制,此处仅作简要说明。
首先,本文借助喀麦隆和加蓬的非洲晴雨表数据研究发现,殖民医疗运动在降低当地居民对医学信任度的同时,并不会影响他们对其他个体或机构的信任度。其次,本文检验了医学信任的传播方式,发现纵向传播(族群内部)的作用占主导,但横向传播(族群之间)的影响也不可忽略。

结论

本文检验了20世纪20年代至50年代法国殖民政府在喀麦隆和前法属赤道非洲地区开展的昏睡病防治运动所带来的长期影响。为此,作者将历史档案数字化,构建了涵盖5个国家30年来殖民医疗运动访问情况的数据集。
本文使用工具变量策略研究发现,在那些历史上被殖民医疗运动访问次数越多的地区,现代的儿童疫苗接种完成率越低、血液检测拒绝率越高,其中后者以显示偏好的方式表明居民对医学的信任程度越低。此外,世界银行在这些地区开展健康项目的实施效果也越不理想。
本文的研究结果表明,殖民医疗运动留下了巨大的历史成本,为了提振中非地区国家居民对健康服务的需求,首先应当重建他们对现代医学的信任。同时,国际组织在制定发展干预政策时也应该充分理解当地的历史背景。

如何在AER上用OLS发经济史研究, 这篇道出了验证IV合理性的标准范式, 还包括各种机制分析。
工具变量法IV
1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析,34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差41.内生性处理的秘密武器-工具变量估计42.工具变量IV必读文章20篇, 因果识别就靠他了43.看完顶级期刊文章后, 整理了内生性处理小册子44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题47.非线性面板模型中内生性解决方案48.内生性处理方法与进展,49.万能cmp程序, 有了他, 建议把其他程序全删掉!50.你的内生性解决方式out, ERM独领风骚51.面板数据是怎样处理内生性的52.计量分析中的内生性问题综述53.一份改变实证研究的内生性处理思维导图54.Top期刊里不同来源内生性处理方法55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法57.二值选择模型内生性检验方法58.2SRI还是2SPS, 内生性问题的二阶段CF法实现59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!66.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!67.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?68.引力模型基础上的工具变量如何构建?69.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!70.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!71.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!72.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!73.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!74.2020年博导圈流传最广的一份“几十种内生性处理方法及其要求和局限”的宝典, 并附上代表性重要文献!75.因变量和内生变量是连续,有序和无序多元变量时, 该如何做工具变量估计?76.太难了! 用天气做工具变量IV都被审稿人质疑! IV竟如此脆弱那有什么IV选取建议呢? 77.天气数据作为工具变量IV的文献清单, 分门别类地为各位整理好了!78.华人金融学术女神为运用工具变量估计方法做因果推断的学者提供了如下宝贵建议!79.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!80.关于工具变量估计的论证思路,各种检验, 操作代码和实证解读, 这可能是最全面的一份兵法!81.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!82.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!83.引力模型基础上的工具变量如何构建?84.使用千年难得的IV+DID方法将中国故事写到了Top5, 设计之巧妙构思之缜密让人叹服不已!84.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

运动有看得见的好处:“提升颜值”!最新研究:定期进行体育锻炼能显著提升个人外貌评分,特别是对于女性、城市居民、中年人
赵海益 彭锻炼|数字技术对城乡劳动力就业分布影响研究
哪本研究方法教科书适合我:进阶篇 | 学科教学
回归分析(OLS)表格简易阅读指南 | 学科教学
政党如何影响国家经济命运?|【政党组织】专题

文章有问题?点此查看未经处理的缓存